eda biçim ne demek?

EDA (Açıklayıcı Veri Analizi)

Açıklayıcı Veri Analizi (EDA), bir veri setini özetlemek, görselleştirmek ve temel özelliklerini anlamak için kullanılan bir yaklaşımdır. Veri modelleme veya hipotez testinden önce gerçekleştirilir ve verinin yapısını, dağılımını, aykırı değerlerini ve değişkenler arasındaki ilişkileri ortaya çıkarmayı hedefler. Amaç, veriye dair içgörü kazanmak ve gelecekteki analizler için doğru soruları formüle etmektir.

EDA'nın Temel Amaçları:

  • Veri Setini Anlamak: Verinin ne anlama geldiğini, hangi değişkenlerin bulunduğunu ve veri türlerini (sayısal, kategorik vb.) belirlemek.
  • Veri Kalitesini Değerlendirmek: Eksik değerleri, aykırı değerleri ve hatalı verileri tespit etmek.
  • Değişkenler Arası İlişkileri Keşfetmek: Değişkenler arasındaki korelasyonları ve bağımlılıkları ortaya çıkarmak.
  • Hipotezler Oluşturmak: Veriye dayalı olarak test edilebilecek yeni hipotezler geliştirmek.
  • Veriyi Model Lemek İçin Hazırlamak: Hangi veri temizleme ve dönüştürme işlemlerinin gerekli olduğunu belirlemek.

EDA'da Kullanılan Teknikler:

  • Özet İstatistikler: Ortalama, medyan, standart sapma, minimum, maksimum gibi temel istatistiksel ölçümleri hesaplamak.
  • Veri Görselleştirme: Histogramlar, dağılım grafikleri, kutu grafikleri, saçılım grafikleri gibi görsel araçlar kullanarak veriyi görsel olarak incelemek.
  • Korelasyon Analizi: Değişkenler arasındaki doğrusal ilişkileri ölçmek.
  • Çapraz Tablolar: İki veya daha fazla kategorik değişken arasındaki ilişkileri incelemek.
  • Aykırı Değer Analizi: Beklenmeyen veya normalden çok farklı olan veri noktalarını tespit etmek.

Önemli Kavramlar:

Kendi sorunu sor